首页> 外文OA文献 >WordNet2Vec: Corpora Agnostic Word Vectorization Method
【2h】

WordNet2Vec: Corpora Agnostic Word Vectorization Method

机译:WordNet2Vec:语料库不可知词矢量化方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A complex nature of big data resources demands new methods for structuringespecially for textual content. WordNet is a good knowledge source forcomprehensive abstraction of natural language as its good implementations existfor many languages. Since WordNet embeds natural language in the form of acomplex network, a transformation mechanism WordNet2Vec is proposed in thepaper. It creates vectors for each word from WordNet. These vectors encapsulategeneral position - role of a given word towards all other words in the naturallanguage. Any list or set of such vectors contains knowledge about the contextof its component within the whole language. Such word representation can beeasily applied to many analytic tasks like classification or clustering. Theusefulness of the WordNet2Vec method was demonstrated in sentiment analysis,i.e. classification with transfer learning for the real Amazon opinion textualdataset.
机译:大数据资源的复杂本质要求新的结构化方法,尤其是文本内容的结构化。 WordNet是自然语言的综合抽象的良好知识来源,因为它对许多语言都存在良好的实现。由于WordNet以复杂网络的形式嵌入自然语言,因此本文提出了一种转换机制WordNet2Vec。它为WordNet中的每个单词创建向量。这些向量封装了一般位置-给定单词对自然语言中所有其他单词的作用。此类向量的任何列表或集合都包含有关整个语言中其组成部分的上下文的知识。这样的单词表示可以轻松地应用于许多分析任务,例如分类或聚类。 WordNet2Vec方法的用处在情感分析中得到了证明,即通过迁移学习对真实的Amazon意见文本数据集进行分类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号